Model Selection

Visual-Language Interaction

# Visual-Language Interaction

Qwen2 VL 7B Visual Rft Lisa IoU Reward

Qwen2-VL-7B-Instruct is a vision-language model based on the Qwen2 architecture, supporting multimodal input of images and text, suitable for various visual-language tasks.

Safetensors English

Chat Vector Llava V1.5 7b Ja

A visual-language model capable of conducting dialogues in Japanese about input images, created using the Chat Vector method by combining weights from multiple models

Transformers Japanese

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase